What Factors Affect Laptop Prices?

Danh sách thành viên nhóm 1 - S2:

STT MSSV Họ và Tên
35 20133076 Văn Mai Thanh Nhật
42 20133082 Huỳnh Minh Phước
3 20133029 Nguyễn Trí Dũng
14 20133047 Lương Gia Huy

Phần 1 - Giới thiệu

Trong thị trường máy tính hiện nay, vì sự tiện lợi và linh hoạt của một chiếc laptop hay còn gọi là máy tính xách tay nên chúng đang dần dần thay thế những chiếc máy bàn cồng kềnh và nặng nề. Mọi thứ của một chiếc pc giờ đây đã gói gọn chỉ bằng một cuốn sách và từ đó ta có thể đem đến mọi nơi từ nhà riêng cho đến văn phòng hay thậm chí là quán cà phê để có thể làm việc, nó chiếm thị phần khá cao và cũng đang trở thành xu hướng hiện đại vì giúp ta có thể đồng bộ, xử lý công việc một cách dễ dàng và nhanh gọn.

Vì vậy trong những năm gần đây, giá của một chiếc laptop đã có nhiều sự thay đổi đáng kể. Có nhiều yếu tố ảnh hưởng đến giá của một chiếc laptop, những yếu tố này bao gồm thương hiệu sản xuất và những chính sách khuyến mãi của hãng hay là những tiện ích đi kèm. Ngoài ra, ở phần cứng, quan trọng chính là dung lượng bộ nhớ có thể lưu trữ dữ liệu, tốc độ của vi xử lý cũng không kém phần ảnh hưởng. Và đóng góp một phần nhỏ có thể kể đến thiết kế bên ngoàihệ điều hành mà nó sử dụng, cũng đã tác động đến giá của một chiếc laptop hiện nay.

Và trong đề tài này, nhóm chúng em xin dùng bộ dữ liệu về thông số kỹ thuật và giá cả của laptop mới nhất để trực quan hoá mối liên hệ và tác động kể trên để phần nào hiểu rõ hơn về việc việc phân tích dữ liệu.

Theo như tác giả, nguồn dữ liệu ở đây được trích xuất từ Flipkart.com, một nền tảng thương mại điện tử hàng đầu của Ấn Độ hiện nay. Phương pháp thu thập đến từ một tiện ích mã nguồn mở tự động trên Chrome có tên là Instant Data Scrapper, nó sử dụng AI một cách tự động để trích xuất dữ liệu từ bất kỳ trang web nào và cho phép lưu dữ liệu thành file xlsx hay csv. Trong phần dữ liệu thì có sử dụng các biến số như là biến số định danh ( tên hãng, tên phiên bản, vi xử lý, ….) , biến số định lượng (ram, ssd, giá, …), ngoài ra còn sử dụng biến số nhị giá (như là màn hình cảm ứng, msoffice).


Phần 2 - Dữ liệu

Phần 3 - Kế hoạch phân tích dữ liệu

1. Các biến kết quả (phản hồi, Y) và dự đoán (giải thích, X) mà nhóm sẽ sử dụng để trả lời câu hỏi của mình.

Biến dự đoán(giải thích):

Biến kết quả(phản hồi):

2. Các nhóm so sánh nhóm sẽ sử dụng, nếu có.

3.Phân tích dữ liệu sơ bộ, bao gồm một số thống kê tóm tắt và biểu đồ trực quan hóa, cùng với một số giải thích về cách chúng giúp nhóm hiểu thêm về tập dữ liệu.

4.(Các) phương pháp thống kê mà nhóm tin rằng sẽ hữu ích trong việc trả lời (các) câu hỏi đặt ra.

Xây dựng mô hình hồi quy tuyến tính với biến giá của laptop là biến phụ thuộc và còn lại là biến độc lập.

5.Kết quả nào từ các phương pháp thống kê cụ thể này là cần thiết để hỗ trợ cho giả thuyết của nhóm?

Dựa vào kết quả của mô hình hồi quy tuyến tính trên sẽ loại những biến khỏi mô hình tương ứng. Từ đó xây dựng các mô hình hồi quy tuyến tính loại bỏ các biến không có tác động lên giá của laptop và chọn mô hình hợp lý để dự đoán giá của laptop.